一招,一种疾病,登陆一区!一口气读完,学会就赢麻了!
大家好,这里是雪梨的生信套路~
DNA甲基化+机器学习最高能发多少分?7.3肯定不是尽头,但它的思路如果对屏幕前的你有所帮助,那就是无价的。本篇文献针对恶性叶状肿瘤(PTs)诊断和分层使用DNA甲基化+机器学习的思路,分析表明相较于其他类似或共定位的癌症,PT甲基组具有独特性。此外,恶性与非恶性PT之间DNA甲基化的差异,也证明了DNA甲基化的诊断潜力。
在此之前,针对PT的诊断主要依靠组织学检查。然而,检查往往很难将恶性叶状肿瘤的边缘性和恶性区分开来(不同肿瘤组织病理学可见于Fig1),同时,临床表现相似,但病程不相同的细胞纤维腺瘤(FA)也是容易被误诊的对象。PT生长更快,术后复发风险更高,如果手术控制不成功,恶性PT通常对化疗和放疗反应不佳,并可能发生转移。
下面就一起来看看具体的研究过程和结果吧~如果你对这篇文章感到熟悉,也许是因为你没有错过上周三的直播课程!如果想继续了解更多新文献、好套路,请继续关注我们的直播内容~
Detailed DNA methylation characterisation of phyllodes tumours identifies a signature of malignancy and distinguishes phyllodes from metaplastic breast carcinoma
对乳腺恶性叶状肿瘤进行详细的 DNA 甲基化分析,确定了恶性肿瘤的特征,并将叶状肿瘤与移行细胞乳腺癌区分开来
期刊:The Journal of Pathology
IF:7.3
发布时间:2024/02/01
技术路线
研究队列和数据收集:
PT队列:收集了33例乳腺叶状肿瘤患者的肿瘤组织样本,包括良性、交界性和恶性叶状肿瘤,以及纤维腺瘤和化生性乳腺癌。
公共数据集: 从GEO数据库中获取了包括PT、乳腺癌、纤维腺瘤和肉瘤在内的817个样本的全基因组甲基化数据。
DNA甲基化分析:
* 使用Illumina EPIC芯片对PT队列进行全基因组甲基化分析。
* 对甲基化数据进行质量控制、标准化和协调,以便进行跨队列的比较。
* 使用EpiDISH方法进行细胞去卷积,估计肿瘤细胞纯度和细胞组成。
数据分析与解读:
t-SNE图:通过t-SNE图可视化样本聚类情况,评估不同肿瘤类型之间的甲基化差异。
差异甲基化区域(DMRs)分析: 使用limma和DMRcate包识别差异甲基化探针(DMPs)和DMRs,并进行基因本体论分析和通路富集分析,探索甲基化差异的生物学意义。
机器学习:使用随机森林算法开发一个分类器,以区分PT和乳腺癌。
结果验证:
* 将PT队列中的DMRs与Hench等人之前研究的PT队列进行验证,并分析HSD17B8基因的表达情况。
* 使用PT/乳腺癌分类器对化生性乳腺癌样本进行测试,评估其区分PT和乳腺癌的能力。
讨论:
* 讨论了DNA甲基化在PT诊断、分子病理学和治疗中的潜在应用价值。
* 强调了进一步研究的必要性,包括多中心研究以验证DNA甲基化生物标志物,并探索其在PT治疗中的应用。
主要发现:
* PT具有独特的甲基化谱,与正常乳腺组织、乳腺癌和肉瘤等其他肿瘤类型显著不同。
* 在PT中,与EMT、PRC2靶基因和KRAS信号通路相关的基因甲基化存在差异。
* 在恶性和非恶性PT之间,HSD17B8基因启动子区域的甲基化水平存在显著差异,并且与预后不良相关。
* DNA甲基化分类器可以区分PT和乳腺癌,并识别潜在的误诊病例。
实验结果
Figure 1
不同等级的 PT 和可能被误诊的类似肿瘤的组织病理学
(A)良性(B)边缘性(C)恶性 PT 患者。
在(A)中可以看到PT的叶状结构,随着肿瘤级别的提高,细胞度、不典型性和浸润性逐渐增加。
本研究中用作比较的组织病理学相似肿瘤包括:
(D)纤维腺瘤(FA)
(E)未分化肉瘤
(F)变性乳腺癌
纤维腺瘤和变性乳腺癌分别与良性和恶性 PT 具有相同的组织病理学特征。
Figure 2
与其他共定位或病理上相似的肿瘤相比,DNA 甲基化可将 PT 区分开来
(A)前 500 个可变探针的 t-SNE 显示了样本类型的聚类。PT(紫色)与正常乳腺(浅蓝色)、乳腺癌(蓝色)、肉瘤(绿色)和 FA 组织(红色)分别聚类。在具有相同肿瘤类型的不同队列(如 TCGA BRCA 和 TNBC BRCA)之间观察到的批次效应最小。
(B) EpiDISH 是一种利用甲基化进行细胞解旋的方法,它显示了不同组织类型之间的不同细胞组成。PT 显示出最高的成纤维细胞比例,最低的上皮细胞比例。PT 与(i)乳腺癌和(ii)正常乳腺组织之间存在差异。
(C) Koelsche 及其同事制作的肉瘤分类器将 8 个 PT 样品归类为肉瘤(分类器得分≥0.9),其中大多数归类为皮纤维肉瘤原母细胞亚型(DFSP)。其他PT样本高于0.9阈值的亚型包括恶性周围神经鞘样肉瘤(MPNST-like)、未分化肉瘤(USARC)和类苔藓样纤维瘤病(DTFM)。
Figure 3
DNA甲基化差异可确定PT的恶性程度
(A) Phyllodes(澳大利亚)队列中 355 个显著 DMRs的热图,可区分恶性(SGH ≥ 24)和非恶性(SGH < 24)PT,并显示与 SGH 评分(i 与 ii)相关的亚群。
(B) Phyllodes(澳大利亚)DMRs中恶性与非恶性DNA甲基化差异(%)与Phyllodes(Hench等人)队列[14]中相同区域甲基化的相关性比较(r = 0.75,p < 2.2 × 10-16),突出显示了两个队列中四个最显著的DMRs。
(C) Phyllodes(澳大利亚)DMR 分析得出的低甲基化探针的 GSEA。
SGH:新加坡中央医院Singapore General Hospital,它的小组制定了一个列线表,根据细胞不典型性、每10个高倍视野有丝分裂计数、有无基质过度生长以及边缘状态进行评分。
DMR:差异甲基化区域Differentially Methylated Regions
Figure 4
恶性和非恶性PT之间不同甲基化区域的验证
(A) 在Phyllodes(澳大利亚)和Phyllodes(Hench等人)队列中对恶性(SGH≥24)和非恶性(SGH<24)PT进行独立分析得出的DMRs韦恩图。两个队列中有 53 个 DMR 重叠,且所有DMRs的效应方向一致。
(B) 描述 53 个验证 DMRs 位置和甲基化水平的 Circos 热图。注意它们在恶性样本中都出现了高甲基化。
(C)每个样本中排名最靠前的 DMRs 的甲基化水平(根据每个队列分析中 FDR 排名最靠前的基因定义)。在发现组和验证组中,DMR排名最高的基因是HSD17B8、NADK、NELFA和GFM1/LNX。
值得注意的是,两个队列中最重要的DMR是一个覆盖启动子并延伸到HSD17B8基因体的广阔区域。通过一些补充材料中显示的结果,研究团队发现EpiDISH 预测的细胞类型比例与 HSD17B8 甲基化没有关联,然而HSD17B8甲基化与SGH评分呈显著正相关。这表明HSD17B8甲基化可能是一个连续的过程,随着不典型程度的增加而增加,同时与年龄呈近乎显著的负相关。
HSD17B8 表达的降低与乳腺癌的不良生存结果有关,包括在 BRCA(TCGA)队列中。因此,研究团队使用完整的 BRCA (TCGA) 数据集来检验 HSD17B8 表达与甲基化之间的关联。观察到 HSD17B8 甲基化阳性与基因表达下降之间存在明显的关联,表明甲基化变化具有潜在的调控作用。
阅读中有任何疑惑
或是想get同款思路
记得扫码添加雪球老师
Figure 5
HSD17B8 - 恶性 PT 启动子 DNA 高甲基化的证据,单细胞表达谱分析显示成纤维细胞群体中的低表达
(A)热图和 HSD17B8 基因与 DMR 的相对位置显示,与非恶性 PT 相比,恶性 PT 存在不同程度的高甲基化。
(B)来自三个恶性 PT 的单细胞表达数据的 UMAP(分辨率 = 0.4)。主要集群由细胞类型特异性表达特征定义,“SingleR ”预测主要集群为成纤维细胞(肿瘤)。
(C)单细胞细胞类型预测 UMAP 上叠加的 HSD17B8 表达密度描绘,显示成纤维细胞内的表达极少,而上皮细胞内的表达水平较高。这与在恶性样本中观察到的高基因启动子甲基化水平一致。
要确定 HSD17B8 表达的细胞特异性和随恶性程度的变化,还需要包括非恶性 PT 在内的更大规模的单细胞群。
根据Figure 2A,移行细胞乳腺癌在很大程度上与非移行细胞乳腺癌聚集在一起,远离PTs。因此,假设可以利用移行细胞乳腺癌和非移行细胞乳腺癌之间的甲基化差异来区分移行细胞乳腺癌和PT。
Figure 6
PT、乳腺癌和正常乳腺组织的 DNA 甲基化比较
(A)所有样本和组织类型中 500 个可变探针的 t-SNE。显示了PT(紫色,n = 69)、乳腺癌(蓝色,n = 150)、移行细胞乳腺癌(橙色,n = 15)和正常乳腺组织(浅蓝色,n = 50)群。两个移行细胞乳腺癌样本(TCGA-AC-A2QH 和 TCGA-AC-A7VC)与 PTs 聚类。证实了PT在很大程度上聚集在远离乳腺癌/组织样本的地方。
(B) PT 与乳腺癌分类器模型测试结果的四倍图。绿色象限表示与参考相比肿瘤类型预测正确,红色象限表示预测错误。对 PT 和来自 Phyllodes(Hench 等人)队列的乳腺癌样本进行模型测试,结果显示 57/63 预测正确。
(C) 对来自 TCGA 和 Phyllodes(澳大利亚)队列的移行细胞乳腺癌样本进行分类器测试,结果显示有 13/15 例预测正确。
Table 1
PT与乳腺癌随机森林模型训练组和测试组的统计结果
想要高效发文的朋友们快来投奔挑圈联靠的站姐——雪球老师吧!跟着大部队走,这是生信发高分的最快途径了~
如果你想做机器学习思路相关的生信,想获得拆解的原文献,或者想收看最新的直播课程,就扫描下方二维码添加雪球老师微信获得更多资讯吧!
今晚八点的直播将详细拆解生信如何最高性价比地发表SCI~
现在添加雪球老师微信,回复“0612”,即可获取原文~
都看到这里了,点个星标再走吧!